¡Bienvenido!

R para Ciencia de Datos en Salud:
Análisis Descriptivo e Inferencia Estadística

Percy Soto-Becerra M.D., M.Sc(c)

InkaStats Data Science Solutions | Medical Branch
@github/psotob91

Agosto 06, 2022

¡Hola Mundo!

Percy Soto-Becerra, M.D., M.Sc(c)

Datos y mundo actual


La crisis de replicabilidad de la Ciencia (incluyendo Ciencias Médicas)


Ciencia de Datos


En general

  • La Ciencia de Datos es una disciplina que se dedica al estudio y aplicación de técnicas diversas (estadística, informática, etc.) para convertir datos crudos en información y conocimiento.

  • En este curso aprenderemos a hacer esto de manera ordenada.

  • Este es un curso introductorio con énfasis en pensamiento estadístico.

En salud

Ciencia de Datos en Salud (Health Data Science en inglés) es la ciencia y el arte de generar soluciones basadas en datos a través de la comprensión de problemas de salud complejos del mundo real, empleando el pensamiento crítico y el análisis para derivar conocimiento de los (grandes) datos.1

Análisis de datos reproducible

Checklist de reproducibilidad


¿Qué significa que un análisis de datos es “reproducible”?

A corto plazo:

  • ¿Las tablas y figuras se pueden reproducir del código y datos?

  • ¿El código realmenet hace lo que quieres que haga?

  • ¿Es claro por qué el código hace lo que hace?

A largo plazo:

  • ¿Puede el código ser usado con otros datos?

  • ¿Puedes extender el código a otros usos?

Flujograma de ciencia de datos

Kit de herramientas para reproducibilidad


  • Flujo de trabajo reproducible

    • Scriptabilidad R

    • Programación literaria (código, narrativa, salida en un solo lugar) RMarkdown y Quarto

    • Versión de control Git / Github

  • En este curso nos enfocaremos en Scriptabilidad y Programación literaria.

Detalles del curso

FAQ del curso


P - ¿Qué nivel previo de ciencia de datos asume este curso?

R - Ninguno.


P - ¿Es este un curso introductorio de Estadística?

R - Aunque estadística \(\neq\) ciencia de datos, están muy relacionados y existe enorme sobrelapamiento. Este curso es una buena forma de aprender Estadística, sin embargo, no es un curso típico de un programa formal de Estadística.


P - ¿Haremos computación?

R - Sí.

FAQ del curso


P - ¿Este es un curso introductorio de programación?

R - No.


P - ¿Qué lenguaje aprenderemos?

R- R.


P - ¿Por qué no otro lenguaje?

R- Lo discutiremos en su momento .

Acerca del curso

  • Teorías y código práctico completamente asincrónico.

  • Componente sincrónico opcional:

    • Reunión sincrónica 1 vez a la semana (1 hora).
      • Martes o jueves de 7 pm a 8 pm.
      • Pueden conectarse ambos días, o ningún día, ustedes eligen.
      • Sugerimos traten de hacerlo al menos una vez por semana!
    • Agenda:
      • Absolver consultas.
      • Resolver ejercicios de código en vivo.
      • ¡Sí!, sí pueden traer sus propios trabajos de investigación o análisis de datos para recibir asesoría.

Web del curso


  • Todo el contenido será subido a la web del curso: https://rcds3.inkastats.es/

  • La web así como todos los slides tienen derechos de autor y licencia .

  • Siempre y cuando sea para fines no comerciales, ustedes pueden…

    • Pueden reutilizar los slides y compartirlos (¡son libres en la web!).

    • También el código fuente que los genera (lo puedes encontrar aquí).

    • En todos los casos, deben citer la fuente.

  • Sin embargo, los videos cuentan con una contraseña que les has sido proporcionada previamente:

    • ¡No compartir la contraseña!

Problem Sets

  • 7 problem sets opcionales.

  • Son requeridos para constancia de aprobado.

  • Si no se resuelven, solo tendrán constancia de participación.

  • Se colgarán en siguiente enlace: https://rcds3.inkastats.es/assignment/

Constancias


Constancia de aprobado

  • Cuando el participante haya aprobado satisfactoriamente con nota mínima 14 (catorce) el curso.

  • Solo necesita resolver los problem sets y subirlos al enlace que se habilitará para tal fin: https://rcds3.inkastats.es/assignment/


Constancia de participación

  • Cuando no tenga nota aprobatoria habiendo cumplido con las actividades programadas según lo establecido en el syllabus.

  • ¡Solo debe conectarse y ver las videoclases en tiempo asincrónico!